热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

论文简述|EAOSLAM:基于集成数据关联的单目半稠密物体级SLAM

点击上方“3D视觉工坊”,选择“星标”干货第一时间送达1摘要对象级数据关联和姿态估计在语义SLAM中起着重要作用,但由于缺乏鲁棒和精确的算法,这一问题一直没有得到解决

点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

1

摘要

对象级数据关联和姿态估计在语义SLAM中起着重要作用,但由于缺乏鲁棒和精确的算法,这一问题一直没有得到解决.在这项工作中,我们提出了一个集成参数和非参数统计检验的集成数据关联策略.通过利用不同统计的性质,我们的方法可以有效地聚集不同测量的信息,从而显著提高数据关联的鲁棒性和准确性.然后我们提出了一个精确的目标姿态估计框架,并且开发了outliers-robust centroid、尺度估计算法和对象姿态初始化算法来帮助提高姿态估计结果的最优性,以帮助提高姿态估计结果的最优性.此外我们建立了一个SLAM系统,可以用单目相机生成半稠密或轻量级的面向对象.地图在三个公开可用的数据集和一个真实场景上进行了大量实验,结果表明,我们的方法在准确性和鲁棒性方面明显优于最先进的技术.

2

介绍

传统的视觉SLAM系统在机器人定位和地图绘制任务中取得了显著的成功.除了传统的功能,语义SLAM还关注环境的详细表达,例如标记地图元素或感兴趣的对象,以支持不同的高级应用程序.物体SLAM是语义SLAM的典型应用,目标是通过利用帧内对象的语义信息来估计更鲁棒和更准确的相机姿态.在这项工作中,我们进一步扩展了对象SLAM的内容,使其能够构建轻量级和面向对象的地图,如图1所示,其中对象由立方体或二次曲面表示,它们的位置、方向和比例精确对齐.

物体SLAM的挑战主要在于两个方面:

  • 现有的数据关联方法在处理包含多个对象实例的复杂环境时不够鲁棒或准确.没有切实可行的办法来系统地解决这个问题.

  • 物体姿态估计不准确,尤其是单目物体SLAM.虽然最近的研究取得了一些改进,但它们通常依赖于严格的假设,而这些假设在现实世界的应用中很难实现.

在本文中,我们提出了EAO-SLAM,一个单目物体SLAM系统,以解决数据关联和姿态估计问题.首先我们将参数和非参数统计检验与传统的IoU-based方法相结合,进行数据关联的模型集成.与传统方法相比,我们的方法充分利用了不同统计量的性质,例如高斯和非高斯测量,因此在关联鲁棒性方面表现出显著的优势.在目标姿态估计方面,提出了一种质心和尺度估计算法以及基于iForest的目标姿态初始化方法.所提出的方法对离群点具有鲁棒性,并且具有较高的精度,这极大地方便了联合姿态优化过程.

本文的贡献总结如下:

  • 我们提出了一种集成数据关联策略,该策略可以有效地聚合对象的不同度量来提高关联精度.

  • 我们提出了一个基于iForest的物体姿态估计框架,它对异常值是鲁棒的,并且可以精确地估计物体的位置、姿态和比例.

  • 基于所提出的方法,我们实现了EAO-SLAM来构建轻量级和面向对象的地图

  • 我们进行了全面的实验,并验证了我们提出的方法在公开可用的数据集和真实场景的有效性.源代码也发布了.

3

系统

(图一)

图一展示了一种轻量级和面向对象的语义地图.

(图二)

图2展示了所提出的对象SLAM框架,它是基于ORB-SLAM2开发的,并且另外集成了一个采用YOLOv3作为对象检测器的语义线程.集成数据关联在跟踪线程中实现,它结合了bounding boxes、语义标签和点云的信息.之后消除异常值,以便为联合优化过程找到准确的初始化.然后对象姿态和比例与相机姿态一起优化,以构建轻量级和面向对象的地图.在半稠密建图线程中,对象建图与[25]生成的半稠密建图相结合,以获得半稠密语义地图.

文献25
Incremental 3d line segment extraction from semi-dense slam,” in 2018 24th International Conference on Pattern Recognition (ICPR).

4

实验

(图五)

图五是直线对齐以估计对象方向.

(图六)

图六是数据关联中不同统计量的分布.(a)点云在三个方向上的位置分布.(b)质心的距离误差分布.

(图七)

图七:数据关联结果的定性比较.(a) IoU方法.(b)IoU和非参数检验.(c) IoU和t-test.(d)我们的方法.

(图八)

图八是姿态估计的可视化结果.

(图九)

图九是物体姿态估计的结果.奇数列:原始RGB图像.偶数列:估计物体姿态.

(图十)

图十是不同的地图表示.(一)RGB图像.(b)稀疏地图.(c)半稠密地图.(d)我们的半稠密语义图.(e)我们的轻量级和面向对象的地图.(d)和(e)EAO-SLAM.

(图十一)

图十一是EAO-SLAM在三个数据集上的结果.顶部:原始图像.底部:半稠密面向对象地图.

(图十二)

图十二是EAO-SLAM在真实场景中的结果.左右:原始图像.中间:半稠密面向对象地图.

其他一些结果:

5

结论

在本文中,我们提出了EAO-SLAM系统,旨在建立半稠密或轻量级面向对象的地图.该系统基于鲁棒的集成数据关联方法和精确的姿态估计框架来实现.大量实验表明,我们提出的算法和SLAM系统能够建立精确的面向对象的地图,并精确地配准目标姿态和比例.本文提出的方法进一步拓展了语义SLAM的范围,并将促进机器人导航、移动操作和人机交互的相关研究.

本文仅做学术分享,如有侵权,请联系删文。

下载1

在「3D视觉工坊」公众号后台回复:3D视觉,即可下载 3D视觉相关资料干货,涉及相机标定、三维重建、立体视觉、SLAM、深度学习、点云后处理、多视图几何等方向。

下载2

在「3D视觉工坊」公众号后台回复:3D视觉github资源汇总,即可下载包括结构光、标定源码、缺陷检测源码、深度估计与深度补全源码、点云处理相关源码、立体匹配源码、单目、双目3D检测、基于点云的3D检测、6D姿态估计源码汇总等。

下载3

在「3D视觉工坊」公众号后台回复:相机标定,即可下载独家相机标定学习课件与视频网址;后台回复:立体匹配,即可下载独家立体匹配学习课件与视频网址。

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的知识点汇总、入门进阶学习路线、最新paper分享、疑问解答四个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近2000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

 圈里有高质量教程资料、可答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  



推荐阅读
  • 能够感知你情绪状态的智能机器人即将问世 | 科技前沿观察
    本周科技前沿报道了多项重要进展,包括美国多所高校在机器人技术和自动驾驶领域的最新研究成果,以及硅谷大型企业在智能硬件和深度学习技术上的突破性进展。特别值得一提的是,一款能够感知用户情绪状态的智能机器人即将问世,为未来的人机交互带来了全新的可能性。 ... [详细]
  • 表面缺陷检测数据集综述及GitHub开源项目推荐
    本文综述了表面缺陷检测领域的数据集,并推荐了多个GitHub上的开源项目。通过对现有文献和数据集的系统整理,为研究人员提供了全面的资源参考,有助于推动该领域的发展和技术进步。 ... [详细]
  • 兆芯X86 CPU架构的演进与现状(国产CPU系列)
    本文详细介绍了兆芯X86 CPU架构的发展历程,从公司成立背景到关键技术授权,再到具体芯片架构的演进,全面解析了兆芯在国产CPU领域的贡献与挑战。 ... [详细]
  • 2020年9月15日,Oracle正式发布了最新的JDK 15版本。本次更新带来了许多新特性,包括隐藏类、EdDSA签名算法、模式匹配、记录类、封闭类和文本块等。 ... [详细]
  • 三角测量计算三维坐标的代码_双目三维重建——层次化重建思考
    双目三维重建——层次化重建思考FesianXu2020.7.22atANTFINANCIALintern前言本文是笔者阅读[1]第10章内容的笔记,本文从宏观的角度阐 ... [详细]
  • 本文介绍如何使用OpenCV和线性支持向量机(SVM)模型来开发一个简单的人脸识别系统,特别关注在只有一个用户数据集时的处理方法。 ... [详细]
  • 从0到1搭建大数据平台
    从0到1搭建大数据平台 ... [详细]
  • 在2019中国国际智能产业博览会上,百度董事长兼CEO李彦宏强调,人工智能应务实推进其在各行业的应用。随后,在“ABC SUMMIT 2019百度云智峰会”上,百度展示了通过“云+AI”推动AI工业化和产业智能化的最新成果。 ... [详细]
  • 独家解析:深度学习泛化理论的破解之道与应用前景
    本文深入探讨了深度学习泛化理论的关键问题,通过分析现有研究和实践经验,揭示了泛化性能背后的核心机制。文章详细解析了泛化能力的影响因素,并提出了改进模型泛化性能的有效策略。此外,还展望了这些理论在实际应用中的广阔前景,为未来的研究和开发提供了宝贵的参考。 ... [详细]
  • 通过使用CIFAR-10数据集,本文详细介绍了如何快速掌握Mixup数据增强技术,并展示了该方法在图像分类任务中的显著效果。实验结果表明,Mixup能够有效提高模型的泛化能力和分类精度,为图像识别领域的研究提供了有价值的参考。 ... [详细]
  • 在 Angular Google Maps 中实现图片嵌入信息窗口的功能,可以通过使用 `@agm/core` 库来实现。该库提供了丰富的 API 和组件,使得开发者可以轻松地在地图上的信息窗口中嵌入图片。本文将详细介绍如何配置和使用这些组件,以实现动态加载和显示图片的功能。此外,还将探讨一些常见的问题和解决方案,帮助开发者更好地集成这一功能。 ... [详细]
  • 从2019年AI顶级会议最佳论文,探索深度学习的理论根基与前沿进展 ... [详细]
  • 超分辨率技术的全球研究进展与应用现状综述
    本文综述了图像超分辨率(Super-Resolution, SR)技术在全球范围内的最新研究进展及其应用现状。超分辨率技术旨在从单幅或多幅低分辨率(Low-Resolution, LR)图像中恢复出高质量的高分辨率(High-Resolution, HR)图像。该技术在遥感、医疗成像、视频处理等多个领域展现出广泛的应用前景。文章详细分析了当前主流的超分辨率算法,包括基于传统方法和深度学习的方法,并探讨了其在实际应用中的优缺点及未来发展方向。 ... [详细]
  • 当前,众多初创企业对全栈工程师的需求日益增长,但市场中却存在大量所谓的“伪全栈工程师”,尤其是那些仅掌握了Node.js技能的前端开发人员。本文旨在深入探讨全栈工程师在现代技术生态中的真实角色与价值,澄清对这一角色的误解,并强调真正的全栈工程师应具备全面的技术栈和综合解决问题的能力。 ... [详细]
  • 利用TensorFlow.js在网页浏览器中实现高效的人脸识别JavaScript接口
    作者|VincentMühle编译|姗姗出品|人工智能头条(公众号ID:AI_Thinker)【导读】随着深度学习方法的应用,浏览器调用人脸识别技术已经得到了更广泛的应用与提升。在 ... [详细]
author-avatar
你一句话就逼我撤退
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有